En este trabajo se abordará el problema de agrupar los barrios de Medellín de acuerdo a distintas dimensiones y analizar espacialmente las agrupaciones.
Dimensión Movilidad Vial y Espacio Público
La dimensión Movilidad Vial y Espacio Público determina en la encuesta de Calidad de Vida, cómo se mueven los Medellinenses. Asi mismo, el tiempo que les toma ir a trabajar, el medio de transporte predominante de las personas que trabajan y la percepción sobre la malla vial, cobertura y calidad del transporte público.
Posibles respuestas:
No responde
No aplica
Otro.
Caminando
Bicicleta
Moto
Bus/Buseta/Ejecutivo
Transporte Informal
Taxi o colectivo
Transporte particular
Metro - cable
Sistema Integrado de Transporte (SIT).
Ferrocarril
Aéreo
Caballo (bestia)
Lancha, Canoa, Bote
P_84 ¿Cuánto tiempo tardan en llegar al sitio de trabajo?
Posibles Respuestas:
No aplica
De 0 a 20 minutos
De 21 a 40 minutos
De 41 a 60 minutos
De 61 a 80 minutos
Más de 81 minutos
P_212 ¿Cuántos vehículos particulares en funcionamiento tiene este hogar? (no incluye vehículo de servicio público o utilizado para generar ingresos) Vehiculo o auto
P_213 ¿Cuántos vehículos particulares en funcionamiento tiene este hogar? (no incluye vehículo de servicio público o utilizado para generar ingresos) Moto o motoneta
P_214 ¿Cuántos vehículos particulares en funcionamiento tiene este hogar? (no incluye vehículo de servicio público o utilizado para generar ingresos) Bicicleta
P_318 Califique Usted en una escala desde 1 hasta 5, la situación en su barrio o vereda, sobre: La pavimentación y señalización de las vias
Posibles respuestas:
Muy mala
Mala
Aceptable
Buena
Muy buena
P_321 Califique Usted, en una escala desde 1 hasta 5, la cobertura en el transporte público en su sector, barrio o vereda en los últimos 12 meses
Posibles respuestas:
Muy mala
Mala
Aceptable
Buena
Muy buena
P_322 Y califique en una escala desde 1 hasta 5, la calidad de ese transporte público en su sector, barrio o vereda
Posibles respuestas:
Muy mala
Mala
Aceptable
Buena
Muy buena
El insumo principal de este trabajo son los datos abiertos del portal Medata y en particular la Encuesta de Calidad de Vida Medellín Cómo vamos.
ECV <- read.csv("./dataSet/encuesta_calidad_vida.csv", header = TRUE, sep=";", encoding = "UTF-8")
Librerias escenciales para el analisis de informacion
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
# Librería creada para automatizar las consultas y para renombrar las columnas
library(Utiltae)
library(lazyeval)
library('sqldf')
## Loading required package: gsubfn
## Loading required package: proto
## Loading required package: RSQLite
library(rgdal)
## Loading required package: sp
## rgdal: version: 1.4-8, (SVN revision 845)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 2.2.3, released 2017/11/20
## Path to GDAL shared files: C:/Users/sanar/OneDrive/Documentos/R/win-library/3.6/rgdal/gdal
## GDAL binary built with GEOS: TRUE
## Loaded PROJ.4 runtime: Rel. 4.9.3, 15 August 2016, [PJ_VERSION: 493]
## Path to PROJ.4 shared files: C:/Users/sanar/OneDrive/Documentos/R/win-library/3.6/rgdal/proj
## Linking to sp version: 1.3-2
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(GGally)
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
##
## Attaching package: 'GGally'
## The following object is masked from 'package:dplyr':
##
## nasa
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(stringr)
library(tidyr)
Se procede a renombrar las cabeceras del dataframe del set de datos
ECV <- setNames(ECV,set_dataSet_names(names(ECV)))
1. Caracterización de las dimensiones para la dimensión Movilidad Vial y Espacio Público
Construcción del dataframe con las preguntas de interes para la dimensión Movilidad Vial y Espacio Público
ECV_MOVILIDAD<- ECV[,c("encuesta","comuna","barrio","estrato","p_83","p_84","p_212","p_213","p_214","p_318","p_321","p_322")]
Revisemos como es el comportamiento de los datos seleccionados
summary(ECV_MOVILIDAD)
## encuesta comuna barrio
## Min. :1.201e+04 MANRIQUE : 28951 CABECERA SAN ANT DE PR. : 8987
## 1st Qu.:5.812e+07 BELEN : 26330 LAS GRANJAS : 5192
## Median :4.713e+08 ARANJUEZ : 24860 MORAVIA : 4537
## Mean :1.424e+09 POPULAR : 22587 SANTO DOMINGO SABIO Nº 1: 4152
## 3rd Qu.:1.592e+09 ROBLEDO : 22051 POPULAR : 4027
## Max. :7.489e+09 DOCE DE OCTUBRE: 21787 CASTILLA : 3873
## (Other) :184008 (Other) :299806
## estrato p_83 p_84 p_212
## Min. :1.000 Min. :-99.00 Min. :-99.00 Min. :0.0000
## 1st Qu.:2.000 1st Qu.:-88.00 1st Qu.:-88.00 1st Qu.:0.0000
## Median :2.000 Median :-88.00 Median :-88.00 Median :0.0000
## Mean :2.701 Mean :-51.65 Mean :-51.92 Mean :0.1965
## 3rd Qu.:3.000 3rd Qu.: 4.00 3rd Qu.: 1.00 3rd Qu.:0.0000
## Max. :6.000 Max. : 12.00 Max. : 5.00 Max. :6.0000
##
## p_213 p_214 p_318 p_321
## Min. :0.0000 Min. :0.0000 Min. :1.000 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:3.000 1st Qu.:4.000
## Median :0.0000 Median :0.0000 Median :4.000 Median :4.000
## Mean :0.2356 Mean :0.2596 Mean :3.402 Mean :3.828
## 3rd Qu.:0.0000 3rd Qu.:0.0000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :5.0000 Max. :9.0000 Max. :5.000 Max. :5.000
##
## p_322
## Min. :1.000
## 1st Qu.:4.000
## Median :4.000
## Mean :3.808
## 3rd Qu.:4.000
## Max. :5.000
##
No existen valores nulos dentro de las preguntas de Movilidad
ECV_MOVILIDAD_DEP <- subset(ECV_MOVILIDAD,p_83 != 'NULL' & p_84 != 'NULL' & p_212 != 'NULL' & p_213 != 'NULL' & p_214 != 'NULL' & p_318 != 'NULL' & p_321 != 'NULL' & p_322 != 'NULL')
nrow(ECV_MOVILIDAD_DEP)
## [1] 330574
Se procede a realizar el cálculo de cada uno de los indicadores definidos para la dimensión Movilidad Vial y Espacio Público
P_83: Porcentaje de personas que usan bicicleta para ir a su empleo principal
P_84: Porcentaje de personas que tardan en llegar al trabajo mas de una hora
P_212: Promedio de vehiculos en el hogar (Vehiculo o auto)
P_213: Promedio de vehiculos en el hogar (Moto)
P_214: Promedio de vehiculos en el hogar (Bicicleta)
P_318: Calificación promedio del estado de la infraestrucutra vial
P_321: Calificación promedio de la cobertura del transporte público
P_322: Calificación promedio de la Calidad del transporte publico en el barrio
2. Agrupamiento
Para efectos de la ejecución de los modelos, los valores del data frame ECV_MOVILIDAD_FINAL que sean nulos se llenan con 0 dado que cuando se presenta un valor NAN significa que el indicador no aplica para el barrio y el cero lo representa
ECV_MOVILIDAD_FINAL[is.na(ECV_MOVILIDAD_FINAL)] <- 0
Dado que los indicadores del dataframe ECV_MOVILIDAD_FINAL se encuentran en función de hogares y personas encuestadas es necesario poner todos los indicadores en la misma escala.
Utilizaremos la técnica de Agrupamiento Kmeans, la cual hace parte del conjunto de algoritmos de aprendizaje no supervisado.
#Kmeans no acepta variables categoricas, el identificador del barrio se convierte en nombre de filas para que no sean consideras por el algoritmo
ECV_MOVILIDAD_FINAL$barrio <- paste(ECV_MOVILIDAD_FINAL$comuna, ECV_MOVILIDAD_FINAL$barrio, sep = "/")
ECV_MOVILIDAD_FINAL$comuna <- NULL
ECV_MOVILIDAD_SCALE <- tibble::column_to_rownames(ECV_MOVILIDAD_FINAL, var = ("barrio"))
ECV_MOVILIDAD_SCALE <- scale(ECV_MOVILIDAD_SCALE)
Método del codo para determinar el k óptimo
Se utilizan el diferentes métodos para determinar el k óptimo del algoritmo de clusterización Kmeans
De acuerdo a la gráfica, el cambio de pendiente más significativo es en el k = 4
Método de la siluetta para determinar el k óptimo
De acuerdo a la gráfica, donde se da el k recomendado es cuando el valor de 2
Diferencia entre los errores generados con diferentes k
De acuerdo a las gráficas de los diferentes metodos, se concluye que k = 7, es el k óptimo para la dimensión Movilidad, por lo cual aplicaremos el algoritmo Kmeans con dicho valor de k
Aplicamos K-MEANS para el k recomendado
Visualización de los grupos
Los tamaños de los cluster son:
## [1] 16 120 24 115 2 1 32
Asignación de clusters a los barrios
kmeans_model
## K-means clustering with 7 clusters of sizes 16, 120, 24, 115, 2, 1, 32
##
## Cluster means:
## P83_IND P84_IND P212_IND P213_IND P214_IND P318_IND
## 1 -0.1666276 0.02633682 -0.2612359 2.09368682 -0.3007924 -0.4406665
## 2 -0.1359880 0.17965817 -0.5262146 -0.22122517 -0.4684933 -0.3224854
## 3 -0.1842883 -0.34898833 2.6548838 0.84275728 1.3720800 1.0118438
## 4 0.1587021 -0.36867016 0.2544272 0.05239415 0.4837018 0.6401992
## 5 -0.5221758 9.10021648 -0.9018539 -0.53689535 2.1953262 -1.3745660
## 6 14.7502181 -1.09327234 -0.9018539 -2.53761060 0.8917717 -6.0695825
## 7 -0.2671589 0.36516433 -0.7170394 -0.92475215 -1.0251930 -1.3543607
## P321_IND P322_IND
## 1 -2.1139420 -2.43455621
## 2 0.1938673 0.14813327
## 3 -0.1225368 -0.02926335
## 4 0.5965678 0.62230543
## 5 -3.1672262 -1.26961761
## 6 -1.5475815 -1.18447402
## 7 -1.4757306 -1.43631835
##
## Clustering vector:
## ALTAVISTA/AGUAS FRÍAS
## 1
## ALTAVISTA/ALTAVISTA CENTRAL
## 1
## ALTAVISTA/ÁREA DE EXPANSIÓN ALTAVISTA
## 7
## ALTAVISTA/ÁREA DE EXPANSIÓN BELÉN RINCÓN
## 4
## ALTAVISTA/BUGA PATIO BONITO
## 7
## ALTAVISTA/CABECERA ALTAVISTA
## 7
## ALTAVISTA/EL CORAZÓN EL MORRO
## 7
## ALTAVISTA/EL JARDÍN
## 7
## ALTAVISTA/LA ESPERANZA
## 7
## ALTAVISTA/SAN JOSÉ DEL MANZANILLO
## 7
## ALTAVISTA/SAN PABLO
## 2
## ARANJUEZ/ARANJUEZ
## 4
## ARANJUEZ/BASILIA
## 4
## ARANJUEZ/BERLÍN
## 4
## ARANJUEZ/BERMEJAL- LOS ÁLAMOS
## 4
## ARANJUEZ/CAMPO VALDÉS Nº 1
## 2
## ARANJUEZ/LA PIÑUELA
## 4
## ARANJUEZ/LAS ESMERALDAS
## 2
## ARANJUEZ/MANRIQUE CENTRAL Nº 1
## 2
## ARANJUEZ/MIRANDA
## 4
## ARANJUEZ/MORAVIA
## 2
## ARANJUEZ/PALERMO
## 4
## ARANJUEZ/SAN ISIDRO
## 4
## ARANJUEZ/SAN PEDRO
## 2
## ARANJUEZ/SEVILLA
## 4
## BELEN/ALTAVISTA
## 2
## BELEN/BELÉN
## 4
## BELEN/CERRO NUTIBARA
## 4
## BELEN/DIEGO ECHAVARRÍA
## 3
## BELEN/EL NOGAL - LOS ALMENDROS
## 4
## BELEN/EL RINCÓN
## 2
## BELEN/FÁTIMA
## 4
## BELEN/GRANADA
## 4
## BELEN/LA GLORIA
## 4
## BELEN/LA HONDONADA
## 3
## BELEN/LA LOMA DE LOS BERNAL
## 3
## BELEN/LA MOTA
## 3
## BELEN/LA PALMA
## 4
## BELEN/LAS MERCEDES
## 2
## BELEN/LAS PLAYAS
## 4
## BELEN/LAS VIOLETAS
## 2
## BELEN/LOS ALPES
## 4
## BELEN/MIRAVALLE
## 4
## BELEN/NUEVA VILLA DE ABURRA
## 4
## BELEN/ROSALES
## 4
## BELEN/SAN BERNARDO
## 4
## BUENOS AIRES/ALEJANDRO ECHAVARRÍA
## 4
## BUENOS AIRES/BARRIO CAYCEDO
## 2
## BUENOS AIRES/BARRIOS DE JESÚS
## 2
## BUENOS AIRES/BOMBONA Nº 2
## 2
## BUENOS AIRES/BUENOS AIRES
## 4
## BUENOS AIRES/CATALUÑA
## 4
## BUENOS AIRES/EL SALVADOR
## 2
## BUENOS AIRES/GERONA
## 2
## BUENOS AIRES/JUAN PABLO II
## 2
## BUENOS AIRES/LA ASOMADERA Nº 1
## 4
## BUENOS AIRES/LA ASOMADERA Nº 2
## 3
## BUENOS AIRES/LA ASOMADERA Nº 3
## 4
## BUENOS AIRES/LA MILAGROSA
## 4
## BUENOS AIRES/LORETO
## 2
## BUENOS AIRES/LOS CERROS EL VERJEL
## 4
## BUENOS AIRES/MIRA FLORES
## 4
## BUENOS AIRES/OCHO DE MARZO
## 2
## CASTILLA/ALFONSO LÓPEZ
## 2
## CASTILLA/BELALCAZAR
## 4
## CASTILLA/BOYACÁ
## 4
## CASTILLA/CARIBE
## 4
## CASTILLA/CASTILLA
## 2
## CASTILLA/DESCONOCIDO
## 7
## CASTILLA/FLORENCIA
## 4
## CASTILLA/FRANCISCO ANTONIO ZEA
## 4
## CASTILLA/GIRARDOT
## 4
## CASTILLA/HÉCTOR ABAD GÓMEZ
## 4
## CASTILLA/LAS BRISAS
## 4
## CASTILLA/PROGRESO
## 4
## CASTILLA/TEJELO
## 4
## CASTILLA/TOSCANA
## 2
## CASTILLA/TRICENTENARIO
## 4
## DOCE DE OCTUBRE/DOCE DE OCTUBRE Nº 1
## 2
## DOCE DE OCTUBRE/DOCE DE OCTUBRE Nº 2
## 2
## DOCE DE OCTUBRE/EL TRIUNFO
## 2
## DOCE DE OCTUBRE/KENNEDY
## 2
## DOCE DE OCTUBRE/LA ESPERANZA
## 2
## DOCE DE OCTUBRE/MIRADOR DEL DOCE
## 2
## DOCE DE OCTUBRE/PEDREGAL
## 2
## DOCE DE OCTUBRE/PICACHITO
## 2
## DOCE DE OCTUBRE/PICACHO
## 2
## DOCE DE OCTUBRE/PROGRESO Nº 2
## 2
## DOCE DE OCTUBRE/SAN MARTÍN DE PORRES
## 2
## DOCE DE OCTUBRE/SANTANDER
## 2
## EL POBLADO/ALEJANDRÍA
## 3
## EL POBLADO/ALTOS DEL POBLADO
## 3
## EL POBLADO/ASTORGA
## 4
## EL POBLADO/BARRIO COLOMBIA
## 2
## EL POBLADO/CASTROPOL
## 3
## EL POBLADO/EL CASTILLO
## 3
## EL POBLADO/EL DIAMANTE Nº 2
## 3
## EL POBLADO/EL POBLADO
## 3
## EL POBLADO/EL TESORO
## 3
## EL POBLADO/LA AGUACATALA
## 4
## EL POBLADO/LA FLORIDA
## 3
## EL POBLADO/LALINDE
## 3
## EL POBLADO/LAS LOMAS Nº 1
## 3
## EL POBLADO/LAS LOMAS Nº 2
## 3
## EL POBLADO/LOS BALSOS Nº 1
## 3
## EL POBLADO/LOS BALSOS Nº 2
## 3
## EL POBLADO/LOS NARANJOS
## 3
## EL POBLADO/MANILA
## 4
## EL POBLADO/PATIO BONITO
## 3
## EL POBLADO/SAN LUCAS
## 3
## EL POBLADO/SANTA MARIA DE LOS ÁNGELES
## 3
## EL POBLADO/VILLA CARLOTA
## 4
## GUAYABAL/CAMPO AMOR
## 4
## GUAYABAL/CRISTO REY
## 4
## GUAYABAL/GUAYABAL
## 4
## GUAYABAL/LA COLINA
## 4
## GUAYABAL/SAN PABLO
## 2
## GUAYABAL/SANTA FE
## 4
## GUAYABAL/TRINIDAD
## 4
## LA AMERICA/BARRIO CRISTÓBAL
## 4
## LA AMERICA/CALAZANS
## 4
## LA AMERICA/CALAZANS PARTE ALTA
## 4
## LA AMERICA/CAMPO ALEGRE
## 4
## LA AMERICA/EL DANUBIO
## 4
## LA AMERICA/FERRINI
## 4
## LA AMERICA/LA AMÉRICA
## 4
## LA AMERICA/LA FLORESTA
## 4
## LA AMERICA/LOS PINOS
## 4
## LA AMERICA/SANTA LUCIA
## 4
## LA AMERICA/SANTA MÓNICA
## 4
## LA AMERICA/SANTA TERESITA
## 4
## LA AMERICA/SIMÓN BOLIVAR
## 4
## LA CANDELARIA/BARRIO COLON
## 2
## LA CANDELARIA/BOMBONA Nº 1
## 2
## LA CANDELARIA/BOSTON
## 2
## LA CANDELARIA/CORAZÓN DE JESÚS
## 4
## LA CANDELARIA/EL CHAGUALO
## 2
## LA CANDELARIA/ESTACIÓN VILLA
## 4
## LA CANDELARIA/GUAYAQUIL
## 5
## LA CANDELARIA/JESÚS NAZARENO
## 4
## LA CANDELARIA/LA CANDELARIA
## 4
## LA CANDELARIA/LAS PALMAS
## 2
## LA CANDELARIA/LOS ÁNGELES
## 4
## LA CANDELARIA/PRADO
## 4
## LA CANDELARIA/SAN BENITO
## 2
## LA CANDELARIA/SAN DIEGO
## 4
## LA CANDELARIA/VILLA NUEVA
## 4
## LAURELES-ESTADIO/BOLIVARIANA
## 4
## LAURELES-ESTADIO/CARLOS E RESTREPO
## 4
## LAURELES-ESTADIO/CUARTA BRIGADA
## 4
## LAURELES-ESTADIO/EL VELÓDROMO
## 4
## LAURELES-ESTADIO/ESTADIO
## 4
## LAURELES-ESTADIO/FLORIDA NUEVA
## 4
## LAURELES-ESTADIO/LA CASTELLANA
## 4
## LAURELES-ESTADIO/LAS ACACIAS
## 4
## LAURELES-ESTADIO/LAURELES
## 4
## LAURELES-ESTADIO/LORENA
## 4
## LAURELES-ESTADIO/LOS COLORES
## 4
## LAURELES-ESTADIO/LOS CONQUISTADORES
## 3
## LAURELES-ESTADIO/NARANJAL
## 4
## LAURELES-ESTADIO/SAN JOAQUÍN
## 4
## LAURELES-ESTADIO/SURAMERICANA
## 4
## MANRIQUE/CAMPO VALDES Nº 2
## 2
## MANRIQUE/EL POMAR
## 4
## MANRIQUE/EL RAIZAL
## 2
## MANRIQUE/LA CRUZ
## 7
## MANRIQUE/LA SALLE
## 2
## MANRIQUE/LAS GRANJAS
## 2
## MANRIQUE/MANRIQUE CENTRAL Nº 2
## 2
## MANRIQUE/MANRIQUE ORIENTAL
## 4
## MANRIQUE/MARIA CANO - CARAMBOLAS
## 7
## MANRIQUE/ORIENTE
## 7
## MANRIQUE/SAN JOSE LA CIMA Nº 2
## 2
## MANRIQUE/SAN JOSELA CIMA Nº 1
## 2
## MANRIQUE/SANTA INES
## 2
## MANRIQUE/VERSALLES Nº 1
## 2
## MANRIQUE/VERSALLES Nº 2
## 2
## PALMITAS/CORREGIMIENTO PALMITAS
## 7
## PALMITAS/LA ALDEA
## 1
## PALMITAS/LA FRISOLA
## 1
## PALMITAS/LA SUCIA
## 1
## PALMITAS/LA SUIZA
## 1
## PALMITAS/POTRERA MISERENGA
## 1
## PALMITAS/SECTOR CENTRAL
## 2
## PALMITAS/URQUITA
## 7
## PALMITAS/VOLCANA GUAYABAL
## 1
## POPULAR/ALDEA PABLO VI
## 2
## POPULAR/CARPINELO
## 2
## POPULAR/EL COMPROMISO
## 2
## POPULAR/GRANIZAL
## 2
## POPULAR/LA AVANZADA
## 7
## POPULAR/LA ESPERANZA Nº 2
## 2
## POPULAR/MOSCU Nº 2
## 2
## POPULAR/POPULAR
## 2
## POPULAR/SAN PABLO
## 2
## POPULAR/SANTO DOMINGO SABIO Nº 1
## 2
## POPULAR/SANTO DOMINGO SABIO Nº 2
## 2
## POPULAR/VILLA GUADALUPE
## 2
## ROBLEDO/ALTAMIRA
## 4
## ROBLEDO/AURES Nº 1
## 2
## ROBLEDO/AURES Nº 2
## 2
## ROBLEDO/BARRIO FACULTAD DE MINAS
## 4
## ROBLEDO/BELLO HORIZONTE
## 2
## ROBLEDO/BOSQUES DE SAN PABLO
## 4
## ROBLEDO/CERRO EL VOLADOR
## 2
## ROBLEDO/CÓRDOBA
## 2
## ROBLEDO/CUCARACHO
## 1
## ROBLEDO/EL DIAMANTE
## 2
## ROBLEDO/FUENTE CLARA
## 7
## ROBLEDO/LA PILARICA
## 3
## ROBLEDO/LÓPEZ DE MESA
## 4
## ROBLEDO/MONTECLARO
## 1
## ROBLEDO/NUEVA VILLA DE LA IGUANA
## 2
## ROBLEDO/OLAYA HERRERA
## 7
## ROBLEDO/PAJARITO
## 1
## ROBLEDO/PALENQUE
## 2
## ROBLEDO/ROBLEDO
## 2
## ROBLEDO/SAN GERMÁN
## 4
## ROBLEDO/SANTA MARGARITA
## 7
## ROBLEDO/VILLA FLORA
## 4
## SAN ANTONIO DE PRADO/AREA EXPANSION SAN ANTONIO DE PRADO
## 2
## SAN ANTONIO DE PRADO/CABECERA SAN ANT DE PR.
## 2
## SAN ANTONIO DE PRADO/EL ASTILLERO
## 7
## SAN ANTONIO DE PRADO/EL SALADO
## 7
## SAN ANTONIO DE PRADO/LA FLORIDA
## 7
## SAN ANTONIO DE PRADO/LA VERDE
## 7
## SAN ANTONIO DE PRADO/MONTAÑITA
## 1
## SAN ANTONIO DE PRADO/POTRERITO
## 1
## SAN ANTONIO DE PRADO/SAN JOSÉ
## 6
## SAN ANTONIO DE PRADO/YARUMALITO
## 4
## SAN CRISTOBAL/AREA DE EXPANCION SAN CRISTOBAL
## 2
## SAN CRISTOBAL/AREA EXPANSION PAJARITO
## 2
## SAN CRISTOBAL/BOQUERÓN
## 4
## SAN CRISTOBAL/CABECERA SAN CRISTÓBAL
## 2
## SAN CRISTOBAL/CIUDADELA NUEVO OCCIDENTE
## 2
## SAN CRISTOBAL/EL CARMELO
## 5
## SAN CRISTOBAL/EL LLANO
## 2
## SAN CRISTOBAL/EL PATIO
## 1
## SAN CRISTOBAL/EL PICACHO
## 7
## SAN CRISTOBAL/EL UVITO
## 2
## SAN CRISTOBAL/EL YOLOMBO
## 4
## SAN CRISTOBAL/LA CUCHILLA
## 2
## SAN CRISTOBAL/LA ILUSIÓN
## 7
## SAN CRISTOBAL/LA LOMA
## 7
## SAN CRISTOBAL/LA PALMA
## 7
## SAN CRISTOBAL/LAS PLAYAS
## 2
## SAN CRISTOBAL/NARANJAL
## 2
## SAN CRISTOBAL/PAJARITO
## 7
## SAN CRISTOBAL/PEDREGAL ALTO
## 7
## SAN CRISTOBAL/SAN JOSE DE LA MONTAÑA
## 2
## SAN CRISTOBAL/TRAVESÍAS
## 2
## SAN JAVIER/ANTONIO NARIÑO
## 2
## SAN JAVIER/BELENCITO
## 1
## SAN JAVIER/BETANIA
## 2
## SAN JAVIER/BLANQUIZAL
## 2
## SAN JAVIER/EDUARDO SANTOS
## 4
## SAN JAVIER/EL CORAZÓN
## 2
## SAN JAVIER/EL PESEBRE
## 2
## SAN JAVIER/EL SALADO
## 2
## SAN JAVIER/EL SOCORRO / LA GABRIELA
## 2
## SAN JAVIER/JUAN XXIII - LA QUIEBRA
## 2
## SAN JAVIER/LA PRADERA
## 4
## SAN JAVIER/LAS INDEPENDENCIAS
## 2
## SAN JAVIER/LOS ALCÁZARES
## 4
## SAN JAVIER/METROPOLITANO
## 2
## SAN JAVIER/NUEVOS CONQUISTADORES
## 7
## SAN JAVIER/SAN JAVIER Nº 1
## 4
## SAN JAVIER/SAN JAVIER Nº 2
## 4
## SAN JAVIER/SANTA ROSA DE LIMA
## 4
## SAN JAVIER/VEINTE DE JULIO
## 4
## SANTA CRUZ/ANDALUCIA
## 4
## SANTA CRUZ/EL PLAYON DE LOS COMUNEROS
## 2
## SANTA CRUZ/LA FRANCIA
## 2
## SANTA CRUZ/LA FRONTERA
## 2
## SANTA CRUZ/LA ISLA
## 2
## SANTA CRUZ/LA ROSA
## 2
## SANTA CRUZ/MOSCU Nº 1
## 2
## SANTA CRUZ/PABLO VI
## 2
## SANTA CRUZ/SANTA CRUZ
## 2
## SANTA CRUZ/VILLA DEL SOCORRO
## 2
## SANTA CRUZ/VILLA NIZA
## 2
## SANTA ELENA/BARRO BLANCO
## 2
## SANTA ELENA/EL CERRO
## 4
## SANTA ELENA/EL LLANO
## 2
## SANTA ELENA/EL PLACER
## 2
## SANTA ELENA/EL PLAN
## 2
## SANTA ELENA/LAS PALMAS
## 2
## SANTA ELENA/MAZO
## 4
## SANTA ELENA/MEDIA LUNA
## 2
## SANTA ELENA/PIEDRA GORDA
## 4
## SANTA ELENA/PIEDRAS BLANCAS
## 7
## SANTA ELENA/SANTA ELENA SECTOR CENTRAL
## 4
## VILLA HERMOSA/BATALLÓN GIRARDOT
## 4
## VILLA HERMOSA/EL PINAL
## 2
## VILLA HERMOSA/ENCISO
## 2
## VILLA HERMOSA/LA LADERA
## 1
## VILLA HERMOSA/LA LIBERTAD
## 2
## VILLA HERMOSA/LA MANSIÓN
## 4
## VILLA HERMOSA/LA SIERRA
## 7
## VILLA HERMOSA/LAS ESTANCIAS
## 2
## VILLA HERMOSA/LLANADITAS
## 2
## VILLA HERMOSA/LOS MANGOS
## 2
## VILLA HERMOSA/SAN ANTONIO
## 7
## VILLA HERMOSA/SAN MIGUEL
## 4
## VILLA HERMOSA/SUCRE
## 4
## VILLA HERMOSA/TRECE DE NOVIEMBRE
## 2
## VILLA HERMOSA/VILLA HERMOSA
## 4
## VILLA HERMOSA/VILLA LILIAM
## 2
## VILLA HERMOSA/VILLA TINA
## 2
## VILLA HERMOSA/VILLA TURBAY
## 7
##
## Within cluster sum of squares by cluster:
## [1] 113.45371 252.43850 58.51808 310.86415 54.09821 0.00000 152.09565
## (between_SS / total_SS = 61.9 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
El modelo da un ajuste del 61.9% con k = 7.
Agregaamos el cluster a la data original
Análisis de cada uno de los Grupos
## P83_IND P84_IND P212_IND P213_IND P214_IND P318_IND
## 1 -0.1666276 0.02633682 -0.2612359 2.09368682 -0.3007924 -0.4406665
## 2 -0.1359880 0.17965817 -0.5262146 -0.22122517 -0.4684933 -0.3224854
## 3 -0.1842883 -0.34898833 2.6548838 0.84275728 1.3720800 1.0118438
## 4 0.1587021 -0.36867016 0.2544272 0.05239415 0.4837018 0.6401992
## 5 -0.5221758 9.10021648 -0.9018539 -0.53689535 2.1953262 -1.3745660
## 6 14.7502181 -1.09327234 -0.9018539 -2.53761060 0.8917717 -6.0695825
## 7 -0.2671589 0.36516433 -0.7170394 -0.92475215 -1.0251930 -1.3543607
## P321_IND P322_IND
## 1 -2.1139420 -2.43455621
## 2 0.1938673 0.14813327
## 3 -0.1225368 -0.02926335
## 4 0.5965678 0.62230543
## 5 -3.1672262 -1.26961761
## 6 -1.5475815 -1.18447402
## 7 -1.4757306 -1.43631835
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## Warning in mean.default(X[[i]], ...): argument is not numeric or logical:
## returning NA
## cluster barrio P83_IND P84_IND P212_IND P213_IND P214_IND P318_IND
## 1 1 NA 0.2328045 2.745893 0.14658161 0.3858035 0.18085739 3.208179
## 2 2 NA 0.2528666 3.121921 0.08595109 0.1929631 0.15941590 3.250342
## 3 3 NA 0.2212407 1.825391 0.81382712 0.2815966 0.39474341 3.726379
## 4 4 NA 0.4458226 1.777120 0.26457193 0.2157566 0.28115933 3.593790
## 5 5 NA 0.0000000 25.000000 0.00000000 0.1666667 0.50000000 2.875000
## 6 6 NA 10.0000000 0.000000 0.00000000 0.0000000 0.33333333 1.200000
## 7 7 NA 0.1669790 3.576883 0.04228793 0.1343568 0.08823875 2.882208
## P321_IND P322_IND
## 1 2.998933 3.032949
## 2 3.818242 3.791282
## 3 3.705914 3.739195
## 4 3.961208 3.930510
## 5 2.625000 3.375000
## 6 3.200000 3.400000
## 7 3.225508 3.326053
Grupo 1
Son barrios donde el 0.23% de sus habitantes piensan que la bicicleta es el medio de transporte predominante para ir a trabajar y el 2.75% se demoran mas de una hora dirigirse a su lugar de trabajo. Además son barrios donde en promedio sus habitantes tienen 0.38 motos por hogar y piensan que la cobertura del transporte público en sus barrios es Aceptable.
Grupo 2
Son barrios donde el 0.25% de sus habitantes piensan que la bicicleta es el medio de transporte predominante para ir a trabajar y el 3.12% se demoran mas de una hora dirigirse a su lugar de trabajo. Además son barrios donde en promedio sus habitantes tienen 0.16 bicicletas por hogar y piensan que la calidad del transporte público en sus barrios es Buena.
Grupo 3
Son barrios donde el 0.22% de sus habitantes piensan que la bicicleta es el medio de transporte predominante para ir a trabajar y el 1.83% se demoran mas de una hora dirigirse a su lugar de trabajo. Además son barrios donde en promedio sus habitantes tienen 0.81 carros por hogar y piensan que la calidad del transporte público en sus barrios es Buena.
Grupo 4
Son barrios donde el 0.45% de sus habitantes piensan que la bicicleta es el medio de transporte predominante para ir a trabajar y el 1.77% se demoran mas de una hora dirigirse a su lugar de trabajo. Además son barrios donde en promedio sus habitantes tienen 0.26 carros por hogar y piensan que la calidad del transporte público en sus barrios es Buena.
Grupo 5
Son barrios donde el 25% de sus habitantes se demoran mas de una hora dirigirse a su lugar de trabajo. Además son barrios donde en promedio sus habitantes no tienen carros, en promedio tienen 0.5 bicicletas por hogar y piensan que la cobertura del transporte público en sus barrios es mala.
Grupo 6
Son barrios donde sus habitantes consideran que la cobertura y la calidad del transporte público en sus barrios es buena. Además, en promedio sus habitantes tienen 0.04 carros y el 3.57% de los mismos se demora mas de una hora para ir a su lugar de trabajo.
Grupo 7
Son barrios donde sus habitantes consideran que el estado de la infraestructura vial es mala. Además, el 3.57% de sus habitantes se demoran mas de una hora para ir a trabajar y en promedio tienen 0.13 motos por hogar.
Análisis espacial
## OGR data source with driver: ESRI Shapefile
## Source: "D:\UNAL\Tecnicas de aprendizaje estadistico\Trabajo 1\TAE_T1\Barrio_Vereda\Barrio_Vereda.shp", layer: "Barrio_Vereda"
## with 332 features
## It has 6 fields
## Integer64 fields read as strings: OBJECTID SUBTIPO_BA
Función que busca capitalizar los nombres de los barrios
Debido a inconsistenias entre los nombres de los barrios de la data de poligonos y los nombres de los barrios de la Encuesta de Calidad de Vida, se procede a realizar reemplazos manuales
Se unen los dataframe de barrios_med en donde se encuentra los poligonos de los barrios de Medellín con su respectivo cluster
Se procede a dibujar el mapa de Medellín señalando cada uno de los barrios a que cluster pertenece